@屈折 vs. 派生:在分布式向量空间中的区分 (Inflection vs. Derivation in a Distributional Vector Space)

核心观点

核心问题: 形态学中的一个经典论断——“屈折比派生在语义上更规则”(inflection is "semantically more regular" than derivation)——是否能得到大规模经验数据的支持?
本文的重新阐释: 将“规则性”操作化为**“对比的稳定性” (Stability of Contrast)。假设屈折关系带来的语义和句法对比,比派生关系带来的对比更加稳定一致。
方法: 使用分布式语义模型 (DSM),将词对之间的“对比”建模为
“偏移向量” (Offset Vectors)。通过比较不同关系下偏移向量的方差**,来量化“对比的稳定性”。
结论: 基于法语数据的实证研究有力地证实了该假设。屈折关系的偏移向量确实比派生关系更稳定(即方差更小),为屈折和派生的系统性差异提供了强有力的定量证据。

1. 介绍 (Introduction)

2. 概念动机 (Conceptual Motivation)

3. 方法 (Method)

4. 实证结果 (Empirical Results)

5. 讨论 (Discussion)